智能论文笔记

评估模型性能的基准在机器学习中起重要作用。但是，没有确定的方法来描述和创建新的基准。此外，最常见的基准测试采用了具有多个限制的性能指标。例如，两个模型的性能差异没有概率的解释，没有参考点可以指示它们是否代表了显着的改进，并且比较数据集之间的此类差异是没有意义的。我们介绍了一种名为基于ELO的预测能力（EPP）的新的元评分评估，该评估构建在其他性能指标之上，并允许对模型进行可解释的比较。 EPP分数的差异具有概率的解释，可以直接比较数据集之间，此外，基于逻辑回归的设计允许根据偏差统计数据评估排名适应性。我们证明了EPP的数学属性，并通过30个分类数据集的大规模基准和视觉数据的现实基准测试的经验结果支持它们。此外，我们提出了一个统一的基准本体，用于对基准进行统一的描述。

translated by 谷歌翻译

R-WhONet: Recalibrated Wheel Odometry Neural Network for Vehicular Positioning using Transfer Learning

Uche Onyekpe , Alicja Szkolnik , Vasile Palade , Stratis Kanarachos , Michael E. Fitzpatrick

分类：机器人

2022-09-13

本文提出了一种转移学习方法，以重新校准我们先前开发的车轮探针神经网络（WHONET），以在全球导航卫星系统（GNSS）不可用的环境中进行车辆定位。已显示WHONET具有学习车轮速度测量中不确定性的能力，以校正和准确的车辆定位。这些不确定性可能表现为轮胎压力从泥泞和不平坦的地形或车轮滑动中的驾驶变化。但是，关注数据驱动方法（例如WHONET模型）的共同原因通常是无法将模型推广到新车。在机器学习模型在特定领域进行培训但部署在另一个领域的情况下，该模型的性能降低了。在现实生活中，从变化到车辆的动力学到传感器噪声的新模式分布，有几个因素对这种降解有影响，偏见会使测试传感器数据的数据因训练数据而异。因此，挑战是探索允许训练有素的机器学习模型自发适应新车辆域的技术。因此，我们提出了重新校准的轮循环神经网络（R-WHONET），该神经网络将WHONET模型从其源域（最初训练该模型的车辆和环境）适应到目标域（一种新车辆，在其上进行了训练）。训练有素的模型将被部署）。通过在几个GNSS中断场景上进行性能评估 - 短期复杂驾驶方案以及长期GNSS中断方案。我们证明，在源域中训练的模型并不能很好地推广到目标域中的新车辆。但是，我们表明，我们的新提议的框架将WHONET模型对目标域中的新车辆的概括提高了32％。

translated by 谷歌翻译